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摘 要 : 发 现 网 络 的 社区 结构 对 于 了 解 复 杂 网 络 的 结构 和 功能 具有 重要 意义 。 针 对 当前 局 部 社区 发 现 算法 扩张 速度 慢 
不 适用 于 大 规模 网 络 的 问题 ， 提 出 了 一 种 基于 图 遍历 的 局 部 社区 发 现 算法 。 该 算法 首先 找 出 网 络 中 度数 最 低 的 节点 ， 
以 该 节点 为 起 点 通过 影响 力 子 数 将 网 络 中 的 节点 分 为 社区 节点 和 边界 节点 ， 形 成 初步 的 社区 划分 ， 然 后 通过 适应 度 函 
数 确 定 边 界 节点 的 社区 得 到 最 终 划 分 结果 。 实 验 结 果 表明 ， 该 算法 在 真实 网 络 上 进行 测试 时 不 仅 能 够 有 效 地 挖 据 网 络 
中 的 社区 结构 而 且 具 有 较 快 的 速度 。 
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Local community detection algorithm based on Graph Traversal 
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Abstract: Detection of communitiy structure is significant in understanding the structures and functions of the complex network. 
In view of the problem of the slowness of the community diffusion and not suitable for large-scale network, The paper proposed 
a local community detection algorithm based on breadth first traversal. The algorithm finds out the node with lowest degree in 
the network, and uses this node as a starting point to divide the nodes into community nodes and boundary nodes to form the 


initial community detection by influence function. Then use fitness function to get the final cover. The experimental results show 


that the algorithm tested in a real network can effectively dig out community structure in the network and have faster speed. 
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0 az 随 着 大 数据 时 代 的 到 来 ， 复 杂 网 络 的 规模 逐渐 增 大 ， 网 络 
的 全 局 信息 逐渐 变 得 难以 把 握 ， 全 局 社区 发 现 算法 已 经 难以 适 
用 于 规模 较 大 的 网 络 ， 因 此 ， 科 研 人 员 提 出 了 局 部 社区 发 现 算 
网 络 的 社区 结构 已 经 成 为 一 个 基本 问题 。 和 补 部 社区 发现 算法 无 需 事先 获得 网 络 的 全 局 信息 ， 相 反 ， 
网 络 、 分 析 复杂 网 络 拓扑 、 预 测 网 络 中 个 体 行为 以 及 深入 理 角 它 是 通过 网 络 中 节点 《〈 子 图 ) 的 局 部 信息 对 社区 进行 扩展 。 局 
网 络 功能 等 方面 发 挥 着 非常 重要 作用 。 这 种 结构 通常 表现 为 一 ”部 社区 发 现 算法 无 需 事先 获取 整个 网 络 的 全 局 信息 就 能 够 进行 
个 网 络 能 被 划分 为 许多 组 ,其 中 组 内 成 员 的 联系 较为 密切 ,而 组 社区 划分 。 与 全 局 社区 算法 相 比 ， 局 部 社区 发 现 算法 在 运行 时 
与 组 之 间 成 员 的 联系 相对 稀疏 (31。 所 谓 社区 发 现 是 利用 网 络 中 间 、 应 用 范围 、 算 法 灵活 性 等 方面 存在 更 大 优势 ， 己 成 为 当前 
包含 的 拓扑 信息 来 发 现 网 络 中 的 模块 化 结构 。 发 现 网 络 中 的 社 ”研究 的 热点 。 目 前 ， 根 据 划 分 思想 不 同 ， 可 以 分 为 标签 传播 算 
区 结构 对 于 控制 疾病 和 网 络 病毒 的 传播 具有 极其 重要 意义 。 法 、 派 系 过 滤 算 法 以 及 局 部 扩张 算法 。 标 签 传播 算法 (LPA 算 
姑 为 科研 人 员 对 社区 结构 定义 的 理解 不 同 , 所 以 在 进行 社 A) 首先 给 网 络 中 所 有 节点 分 配对 应 的 标签 ， 然 后 依据 传播 规 
区 划分 时 遵循 的 标准 也 各 不 相同 ， 可 以 分 为 两 大 类 : 全 局 社区 则 反复 更 新 节点 的 标签 , 直至 整个 网 络 中 节点 的 标签 不 再 改变 。 
发 现 算 法 和 局 部 社区 发 现 算法 由 。 全 局 社区 发 现 算法 在 进行 社 ”最 后 ， 拥 有 同样 标签 的 节点 即 为 一 个 社区 。 由 于 LPA 算法 规定 
区 划分 前 需要 获取 网 络 的 全 局 信息 ， 从 全 局 角度 出 发 进行 社区 每 个 节点 只 能 同时 拥有 一 个 标签 ， 所 以 该 算法 无 法 挖掘 出 网 络 
划分 ， 算 法 结果 可 信和 度 高 癌 。 FER ERASMI. EOS X — Ing, Steve Gregory 等 人 提出 了 COPRA 


社区 结构 是 复杂 网 络 无 处 不 在 的 拓扑 性 质 之 一 , 寻找 复 
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算法 向， 该 算法 允许 节点 同时 拥有 多 个 标签 ， 即 可 以 同时 存在 
于 多 个 社区 中 ， 进 而 发 现 网 络 中 的 重 倒 结构。 派系 过 滤 算 法 是 


基于 渗透 思想 ， 该 算法 定义 k-clique 是 网 络 中 包含 k 个 节点 的 
全 连通 子 图 ， 而 网 络 中 的 社区 是 具有 共享 节点 的 全 连通 子 图 的 
集合 。 该 算法 首先 搜索 网 络 中 所 有 k-clique 然后 建立 以 k-clique 
为 核心 新 图 ， 在 该 图 中 如 果 两 个 k-clique 拥有 k-1 个 共有 节点 
则 为 它们 建立 一 条 边 ， 最 终 ， 每 个 连通 子 图 即 为 一 个 社区 。 局 
部 扩张 是 以 给 定 的 节点 〈 子 图 ) 为 中 心 ， 根 据 传 播 规则 和 判断 
函数 逐步 合并 周围 邻居 节点 ， 以 发 现 社区 结构 。 例 如 ， 
Lancichinetti 等 人 提出 的 LFM 算法 中 ， 该 算法 以 种 子 节点 为 中 
心 , 通过 度量 函数 来 发 现 网 络 中 的 社区 结构 。 由 于 LFM 算法 通 
过 随机 选取 网 络 中 的 节点 作为 种 子 节点 ， 结 果 稳 定性 较 差 ， 需 


要 多 次 运行 取 最 优 结果 。 对 于 这 一 问题 ， Conrad Lee 等 人 提出 
了 GCE SAU, 该 算法 首先 寻找 网 络 中 的 k-clique, BEf FH LEM 


算法 的 适应 度 函 数 对 这 些 k-clique 进行 扩展 。GCE 算法 虽然 稳 
定性 高 ， 但 运行 时 间 较 长 ， 划 分 结果 的 优 劣 很 大 程度 上 依赖 于 
k 值 的 选取 。 

目前 ， 局 部 社区 发 现 算法 大 多 是 将 邻居 节点 逐个 随机 加 入 
社团 中 ， 每 次 迭代 只 能 够 添加 或 删除 一 个 节点 ， 使 得 重复 计算 
次 数 较 多 ， 效 率 较 低 ， 社 团 扩张 速度 较 慢 ， 难 以 适用 于 大 规模 
网 络 。 针 对 这 一 问题 ， 本 文 提出 了 基于 图 遍历 的 局 部 社区 发 现 
算法 ， 其 基本 思想 是 : 把 度数 最 小 的 节点 作为 起 始 节点 ， 根 据 
提出 的 影响 力 函 数 与 设 定 的 阔 值 r 对 网 络 中 的 节点 进行 标记 ， 
形成 初步 的 社区 划分 ,然后 通过 适应 度 函 数 F 来 的 到 最 终结 果 。 


1 ”基于 图 遍历 的 局 部 社区 发 现 算法 
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文献 [56，11,12] 可 知 ， 目 前 大 多 数 的 局 部 社区 发 现 算法 在 
进行 社区 划分 时 , 每 次 只 能 判断 一 个 节点 的 社区 归属 , 为 了 发 现 


网 络 中 的 重 炙 社团 结构 还 需要 对 某 些 节点 进行 重复 判断 ， 这 样 
会 导致 算法 在 进行 社区 划分 时 迭代 次 数 过 多 ， 大 大 增加 了 算法 
的 运行 时 间 , 难以 适用 于 大 规模 网 络 和 社团 数目 较 多 的 网 络 。 针 
对 这 一 问题 , 本 文 提 出 了 基于 图 遍历 的 局 部 社区 发 现 算法 , 解决 
现 有 局 部 社区 算法 效率 较 低 的 问题 。 
1.1 基本 定义 
为 了 准确 理解 本 文 算法 ， 首 先 给 出 如 下 定义 . 
定义 1 MERRER AM G 为 一 个 网 络 表示 为 G(V,E)， 


其 中 V={viyv2yV3.…sVa} 代 表 节 点 的 集合 ，B= (ei es es …ej 代 表 
边 的 集合 。 
定义 2 节点 v 受 到 的 影响 力 NIS(V) 为 
N(v 
MS) = -O —. a) 
Degree(v) 
其 中 : N(v) 表 示 v 的 邻居 节点 中 受 影响 节点 的 数目 ; degree(v) 3€ 


示 节 点 v 的 度数 ,显然 , NIS(V) 的 值 始终 在 0~1, 对 于 起 始 节点 ， 
CH NIS 值 为 是 零 。 如 果 节 点 v 的 所 有 邻居 节点 都 受到 影响 ， 
那么 NIS(V) 将 是 1。 


定义 3 


边界 节点 。 如 果 节 点 v 受到 的 影响 力 NIS(V) 小 于 


一 个 预定 的 阔 值 7 (0<r<1)， 那 么 这 个 节点 被 认为 是 一 个 边界 节 
点 (Border Node), 节点 标记 为 BN。 
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社 


定义 4 社 
等 于 一 个 预定 
区 节点 ， 节 点 和 
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limy 
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定义 5 


ERIE. 


的 标记 视 具 


的 一 种 基于 模块 


Kx 


(Q)"" 无 法 评价 重 琶 社区 


时 


复数 社 
度 的 影响 ， 基 于 节点 的 
CEU, ECTS 


来 属于 多 个 社 


区 之 间 的 


体 情况 而 定 。 


区 节点 。 如 果 节 点 v 受到 的 影响 力 NIS(V 大 于 
IBE r (0<r<1)， 那 么 这 个 节点 被 认为 是 一 个 


ERRE (EQ) 是 Shen 等 人 提 


站 ， 该 函数 解决 了 普通 模块 度 
的 问题 。 重 全 模 块 度 函 数 考虑 了 同 
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imli 
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BA 


由 于 此 类 节点 同时 隶属 于 


AS? 


区 ， 在 计算 模块 度 时 应 该 削弱 此 类 节点 对 社 


x WR az 
又 结构 紧密 


EARRA, 


ERARE, ARU TF: 


EE 1 


2m 


已 对 模块 度 的 影响 就 越 小 


— (2 
00. Q) 
1 J 


其 中 : Ai 代表 网 络 中 邻接 矩阵 的 元 素 值 ; m 代 表 网 络 边 的 总 数 ; 


Oi 代表 节点 i 所属 
比 ，EQ 函 数 弱化 了 习 


的 社 


文 个 数 ，kKi 表 示 节 点 i 的 度数 。 与 Q 函 数 相 
EE 县 节点 对 社区 结构 紧密 度 的 影响 ， 当 不 存 


其 


we KO 


1.2 初始 社区 划分 


规则 , 能 够 一 次 判断 选 


在 初始 社区 划分 过 程 中 ， 该 算法 定义 了 一 种 新 的 节点 标记 


在 重合 节点 时 ，EQ 函 数 与 Q 函 数 等 价 。 
定义 7 “适应 度 函 数 。 适 应 度 函 数 是 由 Lancichinetti 提出 
用 于 衡量 社区 内 外 连接 程度 优 劣 的 函数 ， 有 具体 公式 如 下 ; 
KE 
F = — (3) 
E T Kn 


区 G 内 部 度数 ， 有 ”为 社区 G 外 部 度数 。 


FP 季 点 所 有 领 居 节点 所 属 社区 , 对 网 络 进 


断 其 所 属 社区 ， 


同 标签 的 社区 节点 则 被 认为 已 经 稳 


后 续 阶 段 


行 初始 社区 划分 , 减少 算法 过 代 次 数 , 提高 算法 效率 。 经 过 初始 
社区 划分 后 ,网 络 中 的 节点 被 分 为 边界 节点 与 社区 节点 2 大 类 。 
其 中 , 边界 节点 由 于 受到 影响 力 小 , 暂时 无 法 判 
需要 进一步 判断 ， 而 拥有 相 
定 , 在 进行 社区 最 终 划分 时 只 需 判断 边界 节点 , 减 小 了 
需 判 断 的 节点 数目 。 

初始 社区 划分 标记 规则 如 下 : 


为 


BN 


a) 起 始 节 点 一 定 是 边界 节点 ， 标 记 为 BN。 


b) 如 果 一 个 节点 为 边界 节点 ] 
为 也 为 边界 节点 ， 邻 居 节 点 的 标记 为 BN。 

9 如 果 一 个 节点 为 边界 节点 ] 
社区 节点 ， 则 将 该 节点 从 边界 节点 改 为 社 
更 新 该 节点 初始 的 标签 ， 


的 标签 相同 。 


dd) 如 果 一 个 节点 为 社区 节点 ] 
为 边界 节点 ， 则 将 令 


昌 通 过 该 节点 发 现 其 邻居 节点 


是 通过 该 节点 发 现 其 全 


邻居 节点 
区 节点 ， 其 标记 从 


邻居 节点 的 标记 与 该 节点 的 此 时 


昌 通 过 该 节点 发 现 其 邻居 节点 
居 节 点 的 标记 为 BN, 该 节点 的 标记 保持 不 
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e) 如 果 一 个 


也 为 社区 节点 ， 


节点 为 社 


区 节点 且 通 过 该 节点 发 现 其 邻 


将 其 邻居 


节点 的 标记 为 该 节点 当前 的 标记 。 


日 每 个 
1.3 


节点 只 允许 
最 终 社 区 划分 
经 过 初始 划 


[5 


分 后 ， 网 络 中 的 节点 被 分 为 社 


舍 带 一 个 标记 。 


区 节点 和 边界 节 


点 两 类 , 为 了 


判断 


边界 节点 所 属 社区 ， 


发 现 网 络 中 的 重 闪 结构， 


El 


本 文采 用 Lancichinetti 定义 的 适应 度 函 数 F, 将 边界 节点 分 别 加 


入 到 其 相 邻 的 社 
的 下 值 大 于 合并 前 的 F 值 ， 那 么 就 为 边界 节点 添加 一 个 合 


区 节点 中 ， 


并 计算 合 


并 后 
社 


前 后 的 F 值 ， 若 合 


点 被 划分 在 同一 社区 。 


14 算法 步骤 
输入 : 网 络 G(VE), BME r 
网 络 G 的 社区 划分 结果 


输出 : 


a) 计 算 网 络 中 所 有 节 
点 ， 若 存在 多 个 度 


起 始 节 


为 起 始 节 点 ， 


于 此 时 网 


被 标记 为 边界 


起 


b) 


标记 ; 
c) 


存在 ， 则 根据 式 〈1) 计 
给 与 相应 的 标记 ， 


根据 规则 
至 步骤 d); 


dd) 选择 网 络 中 的 边界 节点 与 全 


居 节 点 受到 的 影响 力 ， 


判断 当前 已 标记 节点 


算 所 有 未 标记 邻居 节点 受 型 


始 节点 开始 ， 


节点 ， 标 记 为 BN; 


区 的 标记 , 每 个 边界 节点 可 以 拥有 多 个 标记 。 当 所 有 边界 节点 合 
完毕 后 , 去 网 络 中 掉 所 有 的 BN 标记 , 此 时 拥有 相同 标记 的 节 


点 的 度数 ， 选 取 度数 最 小 的 节点 作为 
数 相同 的 节点 则 从 中 随机 选择 一 个 作 
络 中 的 节点 都 未 被 标记 ， 因 此 该 节点 


根据 式 〈1) 计算 该 节点 周围 所 有 邻 
根据 节点 标记 规则 对 邻居 节点 进行 的 


是 否 还 有 未 被 标记 的 邻居 节点 , 若 
的 影响 力 
再 次 执行 步骤 9); 若 不 存在 ， 则 跳 转 


b 居 社区 进行 合并 ， 根 据 式 


(3) 计算 每 次 合并 前 后 的 适应 度 


的 F 大 于 合 
新 ; 


前 的 社区 F， 则 按照 规 


函数 (FE)， 若 合并 后 新 社区 
则 对 合并 后 的 节点 标记 更 


6) 当 网 络 所 有 边界 节点 均 合 
记 ， 将 拥有 相同 标记 的 节点 被 划分 到 统一 社 


1.5 ”时间 复 杂 度 分 析 


上 文 可 知 ， 本 文 算法 主要 可 以 分 为 初始 社 


社区 划分 两 个 阶段 。 对 于 一 个 包含 n TB Im 


寻找 起 始 节点 需要 计算 网 络 中 所 有 节点 的 度数 并 
度数 最 小 的 节点 作为 起 始 节点 ， 时 间 复 杂 度 为 0(n); 社 


完毕 时 


区 掉 所 有 的 BN 标 
区 中 。 


区 划分 、 最 终 
条 边 的 网 络 ， 
EBEN dE 
区 初始 


划分 需要 计算 网 络 中 所 有 


小 与 阅 


O(n); 最 终 社 


E r 的 大 小 对 节点 进行 标记 ， 这 一 阶段 时 
区 划分 需要 将 相同 标签 的 社 


新 节点 
直到 下 无 法 
独立 的 社 


将 网 


络 中 的 节点 进行 合并 ， 计 算 


节点 的 NIM 值 ， 并 根据 NIM 值 的 大 
间 复 杂 度 为 
区 节点 压缩 为 一 个 个 
每 次 合并 后 的 fü. 


再 增 大 ， 这 里 考虑 最 坏 情况 ， 即 每 个 所 有 节点 均 为 
区 需要 两 两 合并 , 这 种 情况 时 


间 复 杂 度 为 O(m)。 最 终 ， 


本 文 算法 的 时 间 复 杂 度 为 Oo+m)。 对 于 稀 玻 网 络 ,本 文 算法 的 
复杂 度 可 近似 为 0(n)。 


2 ”算法 测试 


2.1 BENI 


由 算法 思想 可 知 本 文 算法 中 浆 


劣 与 社区 最 终 的 


E r 的 大 小 对 社区 结构 的 优 


划分 结果 有 重要 影响 ， 医 


的 初始 值 ， 这 里 ， 
Karate 数据 集 、Football 数据 集 、Dolphins %4 


代表 性 的 真实 数据 。 


AE, EA 


表 ] 中 Karate 数 所 


社交 情况 进行 观 


ei EU Bp. 


测 而 构建 的 社会 网 络 , 节点 表示 俱 乐 


此 首先 要 确定 阔 值 r 
其 中 ， 真 实数 据 分 别 是 
居 集 以 及 Netscience 


昌 集 是 通过 对 美国 大 学 某 俱乐部 成 员 的 
部 的 成 员 ， 


节点 间 的 边 表示 成 员 之 间 存 在 的 友谊 关系 ;Football 数据 集 是 


Fl 
AUAM, 
只 球 队 之 间 进 行 
西 兰 海豚 群体 的 


学 家 Newman 等 


人 根据 美国 
络 中 的 节点 代表 足球 队 ， 节 点 之 间 
过 比赛 ; Dolphin 数据 集 是 Lusseau 
交流 情况 而 得 到 的 海 


点 表示 海豚 , 而 边 表示 海 


一 个 从 事 网 络 理 
表 研 究 人 员 ， 两 


草 。 


通过 在 4 TURA 


论 研究 和 实验 的 共同 作者 网 络 ， 虽 
节点 之 间 的 边 表示 两 位 


上 分 别 运行 30 KRAE r 


YT 


大 学 生 足 球 联 赛 而 构建 的 一 个 复 
的 边 表示 两 
等 人 根据 新 
豚 社 会 关系 网 络 ， 其 中 节 
ON em a 


的 平均 值 发 


现 当 r 的 范围 在 0.4<r 志 0.8 时 得 到 的 EQ 值 较 好 , 当 阔 值 r=0.7 
时 在 大 多 数据 集 上 得 到 的 社区 结构 最 佳 ( 如 图 1)。 因 此 ， 在 接 
F 来 的 实验 中 本 文选 择 阔 值 r 的 值 为 0.7。 
表 1 数据 集 信息 
Number Dataset Nodes Edges 
1 Karate 34 78 
2 Football 115 613 
3 Dolphins 62 159 
4 Netscience 1461 2742 
10 
—k- Karate 
T —€9— Football 
=€- Dolphin 
—Á- Netscience 
06 
a 
山 04 


2.2 人工 网 络 实验 


为 了 更 好 的 
了 实验 〈 图 2)。 
区 划分 时 不 同 阶 
节点 经 过 初始 社 


两 大 类 。 其 中 , 边 


图 1 EQ 值 与 阅 值 + 的 关系 


阐述 算法 过 程 ， 
K 2 Wow f ÆRE r-0.7 时 
段 每 个 节 
区 划分 后 ， 网 络 被 划分 为 边界 节点 逢 


本 文 在 构造 的 简单 网 络 上 进行 
本 文 算法 在 初始 社 
点 的 标记 。 可 以 看 出 以 节点 8 为 起 始 


[社区 节点 


界 节点 有 节点 3、 8.13, 社 


x 节点 为 拥 


标 
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记 7 的 节点 5、7， 拥有 标记 0 的 节点 1 
12。 在 进行 最 终 划分 时 


的 节点 9、10、11、 


合并 前 后 的 F 函数 ， 
分 结果 如 表 3 所 示 。 


区 节点 ， 只 需 将 边界 节点 加 入 其 邻居 社区 中 根据 公式 (3 ) 计算 
判断 其 最 


终 所 属 社区 


2. 4, 拥有 标记 10 
只 需 将 无 需 再 判断 社 


， 该 网 络 最 终 社 区 划 


ei 


(8) 


图 2 简单 网 络 


表 2 简单 网 络 初 始 社区 划分 


de 5 列 出 了 本 文 算法 和 其 他 三 个 算法 在 三 个 大 规模 数据 集 
下 的 测试 结果 。 实 验 结果 表明 ， 本 文 算法 在 不 同 的 真实 数据 身 
上 均 能 取得 了 相对 较 好 的 EQ 值 ， 划 分 社区 需要 的 运行 时 间 比 
HR 3 个 算法 要 少 。 LEM 算法 由 于 随机 选择 网 络 中 的 节点 作为 
种 子 节点 , 在 实验 过 程 中 , 该 算法 每 次 运行 的 EQ 值 都 不 相同 ， 
容易 受到 种 子 节点 位 置 的 影响 ， 且 在 进行 社区 划分 时 每 次 只 能 
判断 一 个 节点 ， 随 着 网 络 规模 增 大 其 算法 运行 时 间 增 长 较为 明 
显 ; CPM 算法 在 大 规模 数据 集 下 能 够 挖掘 出 质量 较 高 的 社 
但 是 寻找 网 络 中 的 k-clique 需要 较 长 的 时 间 ; COPRA 算法 由 于 
需要 不 定时 的 迭代 更 新 网 络 中 节点 的 标签 耗 时 较 多 ， 在 大 规模 
网 络 下 运行 的 效果 并 不 理想 ;本 文 算法 在 初始 社区 划分 阶段 能 
够 一 次 判断 选中 节点 所 有 邻居 节点 所 属 社区 减少 算法 迭代 次 数 ， 
形成 初步 划分 ， 减 少 最 终 社 区 划分 需要 判断 的 节点 数目 。 


Yr 


X, 


TA 


过 程 节点 名 称 NIS 节点 类 型 标记 表 5 真实 网 络 划分 结果 
1 8 0 力 界 节点 BN 网 络 本 文 算 法 LFM CPM COPRA 
2 5 0.25 边界 节点 BN EQ 0.487 0.365 0.472 0.436 
blogs2 
13 边界 节点 BN 运行 时 间 1.96s 11.8s 3.88s 81.14s 
0.67 
7 社区 节点 7 EQ 0.49 0.196 0.54 0.361 
3 1 Enron 
12 边界 节点 BN 运行 时 间 4.89s 16.4s 10.3s 96.41s 
0.25 
5 社区 节点 7 EQ 0.547 0.642 0.534 一 一 
Amazon 
3 边界 节点 BN 运行 时 站 4.85min 23min  6.63min —— 
10 社区 节点 10 men 
0.75 i 
4 9 社区 节点 10 3 ARE 
1 
11 : 社区 节点 10 本 文 提 出 了 一 种 基于 图 遍历 的 局 部 社区 发 现 算法 ， 该 算法 
12 社区 节点 10 定义 了 影响 力 函 数 NMI, 根据 节点 受到 的 影响 力 与 设 定 的 阔 值 
" 1 0.33 边界 节点 BN r 来 同时 对 多 个 节点 的 标签 进行 更 新 形成 初始 社区 划分 ， 然 后 
2 0.5 边界 节点 BN 通过 适应 度 函 数 来 得 到 最 终 的 社区 划分 ， 减 少 了 算法 在 判定 节 
0 社区 节点 0 点 所 属 社 区 时 的 重复 迭代 次 数 ， 提 高 了 算法 运行 效率 。 实 验证 
" 4 1 社区 节点 0 明 , 本 文 算 法 划分 出 的 社区 质量 虽然 受到 阔 值 r 的 大 小 的 影响 ， 
1 1 社区 节点 0 但 总 体 上 得 到 的 EQ 值 与 上 述 算法 相 比 较 高 ， 即 本 文 算 法 划分 
2 社区 节点 0 出 的 网 络 社区 结构 更 加 准确 ， 并 且 拥 有 较 低 的 时 间 复 杂 度 。 后 
表 3 简单 网 络 最 终 社区 划分 续 工 作 将 考虑 到 网 络 中 边 的 权 值 问题 ， 使 算法 能 够 应 用 到 加 权 
社区 编号 节点 编号 网 络 当中 。 
社区 1 5,8,13,7 
| 参考 文献 : 
社区 2 9,10,11,12 
社区 3 0,1,2,3,4 [1] Zhang Xingyi, Wang Congtao, Su Yansen, et al. A fast overlapping 


2.3 ”大 规模 网 络 数据 集 实验 
为 了 验证 本 文 算 法 在 大 规模 数据 集 上 的 有 效 性 ， 将 本 文 算 


法 与 LEM、CPM 以 及 COPRA 算法 进行 了 比较 , 社 
函数 选取 EQ 函数 作为 评价 标准 ， 选 


x 质量 评价 


区 的 真实 网 络 数据 信息 如 


表 4 所 示 。 
表 4 真实 网 络 数据 描述 
Dataset Nodes Edges 
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Amazon 335K 926K 
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